import pandas as pd

# 读取CSV文件
df = pd.read_csv('某招聘网站数据.csv')

# 将字段名转换为中文
df.rename(columns={
    'positionName': '职位名称',
    'companySize': '公司规模',
    'industryField': '行业领域',
    'createTime': '发布时间',
    'salary': '薪资',
    'district': '发布地区',
    'workYear': '工作经验',
    'jobNature': '职位性质',
    'education': '学历要求',
    'score': '评分',
    'matchScore': '匹配度'
}, inplace=True)


# 按照职位名称和发布地区进行分组，然后计算薪资的平均值
grouped_avg_salary = df.groupby(['职位名称', '发布地区'])['薪资'].mean().reset_index()

# 筛选出平均薪资最低的职位和地区
lowest_avg_salary = grouped_avg_salary.sort_values(by='薪资', ascending=True).head(1)

# 筛选出发布地区平均薪资top3的数据
top3_avg_salary = grouped_avg_salary.sort_values(by='薪资', ascending=False).head(3)

# 筛选出移动企业领域（industryField）包含移动互联网 的总数
mobile_internet_count = df[df['行业领域'].str.contains('移动互联网', na=False)].shape[0]

# 打印结果
print("平均薪资最低的职位和地区及平均薪资最低的薪资：")
print(lowest_avg_salary)

print("\n发布地区平均薪资top3：")
print(top3_avg_salary)

print("\n移动企业领域（industryField）包含移动互联网的总数：", mobile_internet_count)